2005年09月13日
川俣晶の縁側技術関連執筆情報 total 2194 count

やさしく読む「XML 1.0勧告」第37回 文字符号化方式にまつわるジレンマ

Written By: 川俣 晶連絡先

 拙著の下記記事が公開されました。

文字化けなんてサヨナラね! §

 よく、XMLは符号化宣言で文字のエンコーディング方式の名前を明示するから文字化けは起こらないという意見を聞きますが、もしそれだけで文字化けを回避できると思っているのなら、それは甘い!

 そもそも、符号化宣言を文字化け無く読み込まねば、符号化宣言を正しく解釈することすらできないのです!

 世の中の文字コード体系が全てUS-ASCII互換というわけではありません。え、信じられない? EBCDICがどれほど幅広く世の中で使われているか調べてみると良いと思いますよ。(まあ、EBCDICでどれほどのXML文書が書かれているかは疑問ではありますが……)

 それでも、何とか実用性を維持できる理由を今回は読んでいます。